Working with real data in Madrid

Author

Gema Fernández-Aviles

Published

November 8, 2024

Máster en Data Science & Business Analytics

1 Lee las librerías

2 Lee los datos: precios de la vivienda y mucho más en Madrid

2.1 Lee las variables

2.2 Lee el diccionario del dataset

2.3 Lee el objeto espacial con los barrios de Madrid

3 Exploración inicial de los datos

3.1 Creación de una tabla con GT para mostrar las primeras filas del objeto diccionario

3.2 Visualizacicón de las primeras filas del dataset con la librería DT del objeto viviendas, una vez se han homogeneizado los nombres de las variables con la función clean_names() de la librería janitor

3.3 Análisis exploratorio básico de los datos con skimr

3.4 Resumen descriptivo de los datos. No lo ejecuto porque no se ve bien en el html

3.5 Analizamos la variable antigüedad de la vivienda, antig y la variable delincuencia, delincuencia, y utilizamos la función group_by().

3.6 Analizamos la tasa de delincuencia por distritos de Madrid con la función group_by()

4 Analisis espacial

4.1 Crea el objeto viviendas_sf y proyecta el CRS

4.2 Crea un primer mapa con la localización de las viviendas utilizando ggplot2 y geom_sf() con fondo. Utliza la función esp_getTiles() para obtener el fondo del mapa

4.3 Crea un mapa interactivo con leaflet y añade un cluster de puntos con markerClusterOptions()

4.4 Trabajamos con barrios utilizando el objeto barrios_madrid. Comprobamos que los datos y los barrios están bien definidos y en el mismo CRS.

4.4.1 Calcula el precio medio por barrio

4.4.2 Une el precio medio, pm, al objeto barrios_madrid

4.4.3 Especificamos la paleta de color a utilizar

4.4.4 Crea el mapa con los barrios de Madrid y el precio medio de la vivienda